Vers une nouvelle approche d'extraction des motifs séquentiels non-dérivables
نویسندگان
چکیده
Résumé. L’extraction de motifs séquentiels est un défi important pour la communauté fouille de données. Même si les représentation condensées ont montré leur intérêt dans le domaine des itemsets, à l’heure actuelle peu de travaux considèrent ce type de représentation pour extraire des motifs. Cet article propose d’établir les premières bases formelles pour obtenir les bornes inférieures et supérieures du support d’une séquence S. Nous démontrons que ces bornes peuvent être dérivées à partir des sous-séquences de S et prouvons que ces règles de dérivation permettent la construction d’une nouvelle représentation condensée de l’ensembles des motifs fréquents. Les différentes expérimentations menées montrent que notre approche offre une meilleure représentation condensée que celles des motifs clos et cela sans perte d’information.
منابع مشابه
Vers une approche efficace d'extraction de motifs spatio-séquentiels
Résumé. Ces dernières années, l’augmentation de la quantité d’informations spatio-temporelles stockées dans les bases de données a fait naître de nouveaux besoins, notamment en matière de gestion des risques naturels, sanitaires ou anthropiques (p. ex. compréhension de la dynamique d’une épidémie de Dengue). Dans cet article, nous définissons un cadre théorique pour l’extraction de motifs spati...
متن کاملVers une nouvelle approche d'extraction de la logique métier d'une application orientée objet
Résumé. Les compagnies font face à d’énormes coûts pour maintenir leurs applications informatiques. Ces applications contiennent des connaissances corporatives importantes qui deviennent difficiles à récupérer après plusieurs années d’opération et d’évolution. Plusieurs approches ont été proposées afin d’extraire du code source des abstractions pour aider les développeurs à assimiler ces connai...
متن کاملSPAMS: Une nouvelle approche incrémentale pour l'extraction de motifs séquentiels fréquents dans les data streams
Résumé. L’extraction de motifs séquentiels fréquents dans les data streams est un enjeu important traité par la communauté des chercheurs en fouille de données. Plus encore que pour les bases de données, de nombreuses contraintes supplémentaires sont à considérer de par la nature intrinsèque des streams. Dans cet article, nous proposons un nouvel algorithme en une passe : SPAMS, basé sur la con...
متن کاملBordure statistique pour la fouille incrémentale de données dans les Data Streams
Résumé. Récemment la communauté Extraction de Connaissances s’est intéressée à de nouveaux modèles où les données arrivent séquentiellement sous la forme d’un flot rapide et continu, i.e. les data streams. L’une des particularités importantes de ces flots est que seule une quantité d’information partielle est disponible au cours du temps. Ainsi après différentes mises à jour successives, il dev...
متن کاملDes séquences aux tendances
RÉSUMÉ. Les données temporelles peuvent être traitées de nombreuses façons afin d’en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d’enregistrements annotés temporellement. L’analyse des accès à un site web permet par exemple de découvrir que “5% des utilisateurs accèdent à la page register.php puis à l...
متن کامل